Maximumgrad
计算逐元素 Maximum 操作的梯度。该算子是 Maximum 算子的反向传播部分。梯度 dy 将被路由到在前向传播中值较大的那个输入。
\[ \begin{align}\begin{aligned}\begin{split}\text{dx0}_i = \begin{cases}
\text{dy}_i, & \text{if } \text{Input0}_i > \text{Input1}_i \\
0, & \text{otherwise}
\end{cases}\end{split}\\\begin{split}\text{dx1}_i = \begin{cases}
\text{dy}_i, & \text{if } \text{Input1}_i \ge \text{Input0}_i \\
0, & \text{otherwise}
\end{cases}\end{split}\end{aligned}\end{align} \]
- 输入:
Input0 - 前向传播时的第一个输入数据地址。
Input1 - 前向传播时的第二个输入数据地址。
dy - 后续层反向传播回来的梯度数据地址。
Input0_dims - Input0 的维度信息数组。
Input1_dims - Input1 的维度信息数组。
num_dims - 输入张量的维度数量。
core_mask - 核掩码(仅共享存储版本需要)。
- 输出:
dx0 - 计算出的关于 Input0 的梯度地址。
dx1 - 计算出的关于 Input1 的梯度地址。
- 支持平台:
FT78NEMT7004
备注
FT78NE 支持fp32
MT7004 支持fp16, fp32
共享存储版本:
-
void hp_maximumgrad_s(half *Input0, half *Input1, half *dy, int *Input0_dims, int *Input1_dims, int num_dims, half *dx0, half *dx1, int core_mask)
-
void fp_maximumgrad_s(float *Input0, float *Input1, float *dy, int *Input0_dims, int *Input1_dims, int num_dims, float *dx0, float *dx1, int core_mask)
C调用示例:
1//FT78NE示例
2#include <stdio.h>
3#include <maximumgrad.h> // 假设头文件名为 maximumgrad.h
4
5int main(int argc, char* argv[]) {
6 // 假设在DDR空间,且形状相同
7 float *input0 = (float *)0xA0000000;
8 float *input1 = (float *)0xA1000000;
9 float *dy = (float *)0xA2000000;
10 float *dx0 = (float *)0xB0000000;
11 float *dx1 = (float *)0xB1000000;
12
13 int dims[] = {4, 256};
14 int num_dims = 2;
15 int core_mask = 0xff;
16
17 fp_maximumgrad_s(input0, input1, dy, dims, dims, num_dims, dx0, dx1, core_mask);
18 return 0;
19}
私有存储版本:
-
void hp_maximumgrad_p(half *Input0, half *Input1, half *dy, int *Input0_dims, int *Input1_dims, int num_dims, half *dx0, half *dx1)
-
void fp_maximumgrad_p(float *Input0, float *Input1, float *dy, int *Input0_dims, int *Input1_dims, int num_dims, float *dx0, float *dx1)
C调用示例:
1//FT78NE示例
2#include <stdio.h>
3#include <maximumgrad.h> // 假设头文件名为 maximumgrad.h
4
5int main(int argc, char* argv[]) {
6 // 假设在L2空间,且形状相同
7 float *input0 = (float *)0x10000000;
8 float *input1 = (float *)0x11000000;
9 float *dy = (float *)0x12000000;
10 float *dx0 = (float *)0x13000000;
11 float *dx1 = (float *)0x14000000;
12
13 int dims[] = {4, 256};
14 int num_dims = 2;
15
16 fp_maximumgrad_p(input0, input1, dy, dims, dims, num_dims, dx0, dx1);
17 return 0;
18}